DiscoverPodcast DevExpert¿Cómo funciona Deepseek? Las bases de la IA explicadas | DevExpert 1x03
¿Cómo funciona Deepseek? Las bases de la IA explicadas | DevExpert 1x03

¿Cómo funciona Deepseek? Las bases de la IA explicadas | DevExpert 1x03

Update: 2025-02-11
Share

Description

⚠️ ¿Quieres que ninguna IA te quite el trabajo? Entonces necesitas ir más allá con tus conocimientos sobre desarrollo de software.



🎁 Te regalo esta masterclass de 15 minutos donde te cuento todos los detalles 👉 https://devexpert.io/masterclass-15?utm_source=yt&utm_medium=social&utm_campaign=103



---



En este episodio detallado y exhaustivo, profundizamos en la atmósfera actual que rodea a los modelos de lenguaje, centrándonos en el desarrollo chino Deepseek. 



Exploramos qué es un modelo de lenguaje, cómo estos modelos integran la censura, la arquitectura y el funcionamiento detrás de las redes neuronales, el concepto de modelos open-source y el proceso de fine-tuning. 



Además, discutimos las diferencias entre los modelos razonadores y los modelos de lenguaje tradicionales, la técnica de destilación de modelos, la ejecución de modelos de lenguaje de forma local y las complejidades del entrenamiento y la cuantización. 



Este episodio tiene como objetivo proporcionar a los oyentes una comprensión profunda y una perspectiva clara de los aspectos fundamentales y los avances recientes en el mundo de la IA y los modelos de lenguaje.



00:00 Introducción y Contexto del Debate



00:37 Modelos de Lenguaje y Censura



04:18 Funcionamiento Interno de los Modelos de Lenguaje



08:21 Entrenamiento y Parámetros de los Modelos



29:32 Fine-Tuning en Modelos de Lenguaje



40:19 Modelos Razonadores y su Evolución



44:50 Ejecución Local y Modelos Destilados



51:51 Conclusiones y Reflexiones Finales

Comments 
In Channel
loading
00:00
00:00
1.0x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

¿Cómo funciona Deepseek? Las bases de la IA explicadas | DevExpert 1x03

¿Cómo funciona Deepseek? Las bases de la IA explicadas | DevExpert 1x03